1 Постановка задачи

Задача: Разработка метрик и программного обеспечения для оценки детализации множества пространственных объектов, а также детализации карты (базы пространственных данных) в целом на основе учета геометрических, семантических и символьных (применяемых при отображении) параметров. Оценка устойчивости и сопоставимости рассчитанных значений метрик для фрагментов данных, извлеченных из топографических карт одного и разных масштабов.

В рамках работ 2019 г были проведены эксперименты с целью выработки понимания того, каким образом можно оценить детализацию карты в числовой форме. Детализация карт регламентируется только для топографических продуктов, однако явной числовой шкалы уровней детализации пока что не существует. С одной стороны, для каждого масштаба разработаны цензы отбора, устанавливающие по геометрическим и семантическим параметрам минимальный порог вхождения объектов на карту и модель их пространственной локализации (точка, линия, полигоны). С другой стороны, устанавливаются нормы отбора, регламентирующие максимально допустимое количество объектов на единицу площади. Наконец, ограничения визуального восприятия устанавливают графическую точность изображения порядка 0,1 мм, что в свою очередь регламентирует минимальный размер деталей (изгибов) в составе изображаемых линий. Эти три компоненты — цензы, нормы и графическая точность — в совокупности оказывают ключевое влияние на детализацию представления географической среды на карте.

Проведенные в 2018 г. эксперименты показали, что существуют индивидуальные характеристики объектов, такие как средняя площадь изгибов, которые систематически изменяются при переходе с одного масштаба (уровня детализации) на другой. Однако при переходе к оценке детализации однородных множеств пространственных объектов (слоёв), таких как объекты гидрографии или транспортные коммуникации, а также оценке детализации карты как совокупности этих множеств, необходимо учитывать также количество объектов на единицу площади и их топологические отношения. При уменьшении масштаба карты в связи с отбором количество объектов на единицу площади поврехности Земли уменьшается, что по логике должно свидетельствовать об уменьшении детализации представления. Соответствующим образом должно уменьшаться и количество пересечений между объектами внутри одного слоя и между слоями. Это утверждение, однако, справедливо при сравнении карт, покрывающих одну и ту же территорию в разных масштабах. Возникает вопрос, а можно ли на основе этих характеристик надежно определить уровень детализации карты? Исследованию этой надежности был посвящен настоящий раздел работ 2019 года.

2 Анализ геометрических характеристик детализации карты

Для анализа возможных характеристик детализации карты мы воспользовались плотностными показателями, такими как как плотность объектов, плотность вершин, плотность пересечений между объектами, а также показателями размера, такими как средняя ширина и высота изгиба линии (применима как к линейным объектам, так и к площадным), а также минимальный средний размер объекта. Для выполнения эксперимента мы выбрали 9 фрагментов цифровых топографических карт масштабов 1:200 000, 1:500 000 и 1:1 000 000 с охватом порядка \(200\times200~км\) в окрестностях городов Воронеж, Грозный, Москва, Петрозаводск, Ростов-на-Дону, Салехард, Сургут, Уфа и Шарья.

Использовались данные по социально-экономическим объектам (населенные пункты и их структура, транспорт, инженерные коммуникации, административно-территориальное деление). Результаты по трем относительным (плотностным) геометрическим характеристикам представлены на Рис. 2.1.

Relative measures of geometric detail (density)

Рис. 2.1: Relative measures of geometric detail (density)

Анализ полученных результатов показывает, что плотностные характеристики не являются надежными индикаторами уровня детализации. Даже в пределах одного масштаба плотность размещения объектов может отличаться на порядки. Например, для участка Воронеж в масштабе 1:200 000 плотность объектов составляет \(74,7\) на \(100~км^2\), в то время как для участка Салехард всего лишь \(1,9\). Подобный разброс наблюдается во всех масштабах и для всех исследуемых величин (плотность точек, объектов, пересечений), хотя следует отметить что с уменьшением масштаба разброс становится менее радикальным, что наглядно демонстрируют диаграммы размаха (Рис. 2.2).

Выполнение теста Стьюдента на отличие средних между масштабными группами показывает приемлемую статистическую надежность этих отличий (Таблица 2.1), однако огромный разброс самих значений в пределах каждого масштаба вызывает сомнения в надежности использования данных характеристик.

Разброс относительных характеристик геометрической детализации карты (плотность)

Рис. 2.2: Разброс относительных характеристик геометрической детализации карты (плотность)

Таблица 2.1: p-values for Student test on mean value equality for relative detail characteristics
param scale1 scale2 p-value
pnt_density 200 500 0.0235970
pnt_density 500 1000 0.0198256
obj_density 200 500 0.0110676
obj_density 500 1000 0.0212643
int_density 200 500 0.0056675
int_density 500 1000 0.0785035

Абсолютные характеристики детализации, представленные на Рис. 2.3, демонстрируют более устойчивое поведение, однако и в этом случае диапазон разброса значений может отличаться в несколько раз: для тех же участков Салехард и Воронеж в масштабе 1:200 000 отношения средних ширин и высот составляет \(3.8\) и \(2.7\) соответственно. Наиболее стабильный характер имеет минимальная средняя площадь полигонального объекта (Рис. 2.3c), вычисленная как минимум из средних площадей объектов каждого слоя. Тем не менее, и по данной характеристике могут наблюдаться выбросы. Так, например, в масштабе 1:1 000 000 для участка Салехард минимальная площадь полигонального объекта в 136 раз больше следующего по размеру минимальной средней площади участка Сургут.

Absolute values of geometric detail (dimensions)

Рис. 2.3: Absolute values of geometric detail (dimensions)

В целом более качественная разделимость уровней детализации по абсолютным характеристикам в сравнении с относительными подтверждается диаграммами размаха, представленными на Рис. 2.4. Тем не менее, статистическая проверка разделимости уровней детализации по данным характеристикам показывает, что и здесь не во всех случаях наблюдаются значимые отличия в средних (Таблица 2.1).

Разброс абсолютных характеристик геометрической детализации карты (плотность)

Рис. 2.4: Разброс абсолютных характеристик геометрической детализации карты (плотность)

Таблица 2.2: p-values of Student test on equality of mean values for absolute geometric detail characteristics
param scale1 scale2 p-value
width 200 500 0.0025734
width 500 1000 0.1654631
height 200 500 0.0056187
height 500 1000 0.0478674
minarea 200 500 0.0000326
minarea 500 1000 0.0001091

3 Анализ зависимости плотностных характеристик детализации от уровня хозяйственной освоенности территории

Значительный разброс относительных характеристик геометрической детализации обусловлен тем, что территории характеризуются неодинаковой хозяйственной освоенностью и сложностью ландшафта. Если первая особенность влияет на плотность изображения социально-экономических объектов (населённые пункты, транспорт, инженерные коммуникации, промышленные сооружения и т.д.) на топографических картах, то вторая компонента обуславливает плотность изображения природных элементов (рельеф, гидрография, растительность, грунты).

Заметим, что плотность объектов на карте влияет на надёжность оценок детализации, получаемых на основе анализа абсолютных характеристик детализации: при малом количестве и разнообразии объектов оценки размеров будут несостоятельными. Так, например, значительный выброс оценки минимальной средней площади для участка Салехард в масштабе 1:1 000 000 связан с тем, что на этом участке наименее крупными полигональными социально-экономическими объектами являются муниципальные районы, имеющие огромную площадь.

В данной части исследования мы провели эксперимент направленный на выяснение зависимости между уровнем хозяйственной освоенности территории и плотностью размещения социально-экономических объектов на картах. Для определения уровня хозяйственной освоенности мы использовали независимый источник информации — растровый набор данных Copernicus Global Land Cover (https://land.copernicus.eu/global/products/lc), имеющий глобальное покрытие и размер ячейки 100 м. Для каждой ячейки этого растра известна доля одного из 22 типов земельного покрова, из которых два — урбанизированные территории и с/х земли — можно отнести к элементам хозяйственного освоения территории.

Карты земельного покрова для исследованных участков показаны на Рис. 3.13.9

Типы земельного покрова по данным Copernicus Global Land Cover (участок Салехард)

Рис. 3.1: Типы земельного покрова по данным Copernicus Global Land Cover (участок Салехард)

Типы земельного покрова по данным Copernicus Global Land Cover (участок Москва)

Рис. 3.2: Типы земельного покрова по данным Copernicus Global Land Cover (участок Москва)

Типы земельного покрова по данным Copernicus Global Land Cover (участок Ростов-на-Дону)

Рис. 3.3: Типы земельного покрова по данным Copernicus Global Land Cover (участок Ростов-на-Дону)

Типы земельного покрова по данным Copernicus Global Land Cover (участок Уфа)

Рис. 3.4: Типы земельного покрова по данным Copernicus Global Land Cover (участок Уфа)

Типы земельного покрова по данным Copernicus Global Land Cover (участок Петрозаводск)

Рис. 3.5: Типы земельного покрова по данным Copernicus Global Land Cover (участок Петрозаводск)

Типы земельного покрова по данным Copernicus Global Land Cover (участок Сургут)

Рис. 3.6: Типы земельного покрова по данным Copernicus Global Land Cover (участок Сургут)

Типы земельного покрова по данным Copernicus Global Land Cover (участок Шарья)

Рис. 3.7: Типы земельного покрова по данным Copernicus Global Land Cover (участок Шарья)

Типы земельного покрова по данным Copernicus Global Land Cover (участок Грозный)

Рис. 3.8: Типы земельного покрова по данным Copernicus Global Land Cover (участок Грозный)

Типы земельного покрова по данным Copernicus Global Land Cover (участок Воронеж)

Рис. 3.9: Типы земельного покрова по данным Copernicus Global Land Cover (участок Воронеж)

Нами был проведен корреляционный и регрессионный анализ зависимости плотностных характеристик детализации социально-экономических элементов топографических карт от уровня хозяйственной освоенности территории. Диаграммы рассеяния между плотностью точек/объектов/пересечений и долей урбанизированных территорий/сельхозугодий представлены на Рис. 3.10. Дополнительно на них нанесена линия регрессии с доверительными интервалами вероятности 0.95.

Зависимость плотностных показателей детализации социально-экономических элементов карт от уровня компонент хозяйственной освоенности территории: a-c) — урбанизированные территории, d-f) — сельхозугодья

Рис. 3.10: Зависимость плотностных показателей детализации социально-экономических элементов карт от уровня компонент хозяйственной освоенности территории: a-c) — урбанизированные территории, d-f) — сельхозугодья

По результатам анализа была обнаружена статистически значимая (p < 0.05) зависимость между логарифмом процентной доли хозяйственно освоенных земель и плотностью пространственных объектов на карте. Результаты представлены в виде корреляционных матриц, сгруппированных по масштабам на Рис. 3.11. В масштабе 1:200 000 оказалась статистически не значима зависимость между плотностью пересечений и урбанизированностью, а в масштабе 1:500 000 — зависимости между плотностью точек, плотностью объектов и также урбанизированностью. Также можно обратить внимание на то, что в более крупных масштабах доля сельскохозяйственных территорий начинает играть более значимую роль в повышении плотности изображения, что может быть связано с подробным показом подъездных проселочных дорог. При этом стабильно высоким оказывается синтетический показатель urban_crops, получаемый путем суммирования логарифма доли урбанизированных территорий и логарифма доли сельхозугодий (к обоим долям перед логарифмированием прибавляется единица, чтобы избежать отрицательных и бесконечных величин там где доля составляет менее 1%).

Корреляционные матрицы между долей хозяйственно освоенных земель и относительными (плотностными) параметрами детализации карты

Рис. 3.11: Корреляционные матрицы между долей хозяйственно освоенных земель и относительными (плотностными) параметрами детализации карты

Построенные графики показывают что характер отношения между плотностными характеристиками и уровнем хозяйственного освоения зависит от масштаба карты. Характер кривой определяется средним значением нагрузки. Чем она выше (масштаб карты крупнее), тем сильнее уклон кривой. Поскольку нашей целью является нахождение закономерности, не зависящей от масштаба карты, для дальнейшего анализа мы перешли к значениям показателей, нормированных на среднее по всем регионам для соответствующего масштаба. Результирующий график с линией регрессии, построенной уже для данных по всем масштабам, представлен на Рис. 3.12, а соответствующая корреляционная матрица — на Рис. 3.13. Как видно, для общей выборки комплексный показатель, сочетающий долю урбанизированных территорий и долю с/х земель, обладает более высоким коэффициентом корреляции, нежели каждый тип земель по-отдельности.

Зависимость нормированных на среднее плотностных показателей детализации социально-экономических элементов карт всех масштабов от уровня компонент хозяйственной освоенности территории: a-c) — урбанизированные территории, d-f) — сельхозугодья

Рис. 3.12: Зависимость нормированных на среднее плотностных показателей детализации социально-экономических элементов карт всех масштабов от уровня компонент хозяйственной освоенности территории: a-c) — урбанизированные территории, d-f) — сельхозугодья

Корреляционная матрица между долей хозяйственно освоенных земель и относительными (плотностными) параметрами детализации карты, нормированными на среднее (по всем масштабам)

Рис. 3.13: Корреляционная матрица между долей хозяйственно освоенных земель и относительными (плотностными) параметрами детализации карты, нормированными на среднее (по всем масштабам)

Далее мы нашли коэффициенты линейной регрессии следующего вида: \[d_i = \alpha_i + \beta_i \log(u + 1) + \gamma_i \log(c + 1),\] где \(d_i\) — величина \(i\)-й нормированной на среднее по масштабу метрики детализации, \(u\) — доля урбанизированных территорий, \(с\) — доля сельскохозяйственных угодий. Результаты регрессионного анализа приведены в Таблице 3.1. Коэффициенты, полученные по данным со всех масштабов, помечены как NA.

Таблица 3.1: Коэффициенты линейной регрессии между логарифмом процентной доли урбанизированных территорий, логарифмом процентной доли с/х угодий и плотностными параметрами детализации карты
var scale alpha beta gamma
rel_pnt_density 200 0.3377555 0.1430660 0.2215261
rel_pnt_density 500 0.1728683 0.0581261 0.3309201
rel_pnt_density 1000 0.3161193 0.6201529 0.0162345
rel_pnt_density NA 0.2755811 0.2737817 0.1895602
rel_obj_density 200 0.0848690 0.0997295 0.3501925
rel_obj_density 500 -0.0361105 0.1021099 0.4013480
rel_obj_density 1000 0.2622460 0.5022852 0.0925178
rel_obj_density NA 0.1036682 0.2347082 0.2813528
rel_int_density 200 0.1838953 0.0071380 0.3490983
rel_int_density 500 0.1275927 0.2720555 0.2542228
rel_int_density 1000 0.0606578 0.7425950 0.0714322
rel_int_density NA 0.1240486 0.3405962 0.2249178

На заключительном этапе анализа была проанализирована возможность приводить плотностные характеристики детализации к средней для масштаба величине с использованием найденных регрессий. Зная для каждой территории долю урбанизированных и сельскохозяйственных земель, получаем ожидаемое превышение плотности объектов по отношению к средней для масштаба плоности. Поделив фактическую плотность на ожидаемое превышение, получаем приведенную величину плотности. Результирующие данные представлены на Рис. 3.14. Построенные графики свидетельствуют о том, что выполненное приведение способствует существенному нивелированию территориальных контрастов в плотности картографических объектов, обсуловленных неравномерным хозяйственным освоением территории. На представленных диаграммах уже нет случаев, когда плотность объектоа отличается на 1-2 порядка, хотя отличия в несколько раз по прежнему имеются.

Relative characteristics of geometric detail (density)

Рис. 3.14: Relative characteristics of geometric detail (density)

Диаграммы размаха (Рис. 3.15) демонстрируют существенно более компактный интерквартильный разброс, при этом медианные значения смещаются незначительно, что позволяет говорить о более качественной разделимости уровней детализации после выполненного преобразования данных. Это статистически подтверждается результатами теста Стьюдента на равенство средних, приведенными в Таблице 3.2: p-значения для всех масштабных переходов имеют величину ниже 0.005, что существенно лучше, чем аналогичые результаты, полученные для исходных, не преобразованных данных.

Distribution of relative geometric detail characteristics (density)

Рис. 3.15: Distribution of relative geometric detail characteristics (density)

Таблица 3.2: p-values of Student test on mean equality for normalized relative geometric detail characteristics
param scale1 scale2 p-value
pnt_density 200 500 0.0048001
pnt_density 500 1000 0.0030151
obj_density 200 500 0.0000219
obj_density 500 1000 0.0019742
int_density 200 500 0.0007714
int_density 500 1000 0.0020404

Таким образом, можно утверждать, что разработанный нами подход позволяет учесть неравномерность хозяйственного освоения территории при оценке детализации картографических данных. Тем не менее, остающиеся неравномерности в детализации требуют дальнейших поисков предикторов, в том числе в части сложности природной компоненты ландшафта.

4 Выводы

На основе проведенных исследований были сделаны следующие выводы:

  1. Характеристики геометрической детализации карты целесообразно разделить на относительные, характеризующие плотность размещения объектов, и абсолютные, характеризующие их размеры. Эти два вида характеристик являются объектами цензов и норм отбора объектов на картах, но также имеют географическую обусловленность.

  2. Относительные характеристики детализации менее надежно характеризуют уровень детализации данных, поскольку зависят от степени хозяйственной освоенности территории и сложности природного ландшафта. Чем более освоена территория и сложнее ландшафт, тем выше будет плотность элементов карты. Первый фактор влияет на плотность представления социально-экономических объектов, второй фактор — на плотность представления природных объектов на картах.

  3. Надежность абсолютных характеристик (размеров объектов) зависит от сложности картографируемой территории: при невысокой сложности плотность объектов низка и выборка не позволяет получить состоятельные оценки средних и минимальных размеров объектов. При этом, однако, абсолютные характеристики не имеют явной зависимости от сложности картографируемой территории.

  4. Разделение карт по детализации на основе относительных (плотностных) характеристик не может быть надежно осуществлено без привлечения независимой (внешней) информации о сложности территории в социально-экономическом и природном отношении. Для этих целей могут быть использованы геоинформационные продукты, полученные на основе данных дистанционного зондирования, такие как растры типов земельного покрова.

  5. Для компенсации влияния сложности территории на относительные характеристики детализации может быть использован переход к приведенным значениям плотности размещения объектов путем их нормирования на среднюю для масштаба плотность. Приведенная плотность показывает статистически значимую корреляционную связь с логарифмированными значениями доли урбанизированных и сельскохозяйственных земель, и может быть смоделирована на их основе путем линейной регрессии. Таким образом, подобрав единожды модель регрессии между этими величинами и зная долю урбанизированных и сельскохозяйственных земель для участка, покрытого данными, можно предсказать, насколько покрывающие территорию данные должны отличаться по плотности размещения объектов от среднестатистических для данного масштаба. Применение данного подхода позволяет качественно улучшить разделимость уровней детализации на основе плотностных характеристик: дисперсии величин и p-значения теста Стьюдента на отличия в их средних снижаются в несколько раз.